AI-Startup Anthropic dituduh secara agresif mengumpulkan data dari situs web.

Penerbit web mengeluh: Pengembang mengumpulkan konten tanpa izin untuk pelatihan AI dan mengabaikan permintaan untuk berhenti.

28/7/2024, 13.12
Eulerpool News 28 Jul 2024, 13.12

Startup KI Anthropic dituduh melakukan scraping data secara agresif dari situs web untuk melatih sistemnya, yang mungkin melanggar persyaratan penggunaan penerbit, menurut pihak yang terkena dampak.

Pengembang AI mengandalkan sejumlah besar data dari berbagai sumber untuk membuat model bahasa besar yang menjadi teknologi di balik chatbot seperti ChatGPT dari OpenAI dan Claude dari Antropik.

Anthropic didirikan oleh mantan peneliti OpenAI dan berjanji untuk mengembangkan sistem AI yang "bertanggung jawab". Namun, Matt Barrie, CEO dari Freelancer.com, menuduh perusahaan yang berbasis di San Francisco tersebut sebagai "scraper paling agresif" dari platform Freelancer-nya, yang mencatat jutaan kunjungan harian.

Penerbit Web Lain Membagikan Kekhawatiran Barrie bahwa Anthropic Membanjiri Situs Mereka dan Mengabaikan Instruksi untuk Menghentikan Pengumpulan Konten. Menurut Barrie, Freelancer.com Menerima 3,5 Juta Kunjungan dalam Empat Jam dari Webcrawler Terkait Anthropic. "Itu Mungkin Sekitar Lima Kali Lebih Banyak dari Nomor Dua," Kata Barrie.

Kunjungan oleh bot ini terus meningkat, meskipun Freelancer.com telah mencoba untuk menolak akses menggunakan protokol standar. Barrie kemudian memutuskan untuk memblokir seluruh lalu lintas data dari alamat IP Anthropics. "Kami harus memblokir mereka karena mereka tidak mematuhi aturan internet," kata Barrie. "Scraping yang mencolok ini memperlambat situs untuk semua pengguna dan pada akhirnya merugikan pendapatan kami.

Anthropic mengumumkan bahwa mereka akan menyelidiki kasus tersebut dan menghormati permintaan penerbit untuk tidak "mengganggu atau mengusik".

Melakukan Scraping Data yang Dapat Diakses Publik Secara Umum Legal, Tetapi Dapat Melanggar Ketentuan Penggunaan Situs Web dan Menjadi Mahal bagi Operator Situs.

Sure, here's the heading translated to Indonesian:

iFixits Syarat Penggunaan melarang penggunaan data mereka untuk pembelajaran mesin. "Pesan pertama saya kepada Anthropic adalah: Jika Anda menggunakan ini untuk melatih model Anda, itu ilegal. Pesan kedua saya adalah: Ini bukan perilaku sopan di internet. Crawling adalah masalah etiket.

Sure, here is the translation of the heading to Indonesian:

"Situs web menggunakan protokol 'robots.txt' untuk menjauhkan crawler dan robot web lainnya dari area tertentu pada situs mereka, namun ini bergantung pada kepatuhan sukarela. Anthropic mengatakan bahwa crawler mereka menghormati 'teknologi anti-penyelundupan' seperti CAPTCHA dan bahwa 'perayapan kami tidak boleh mengganggu atau mengganggu'.

Pengambilan Data Telah Meningkat Secara Dramatis dalam Dua Tahun Terakhir Akibat Perlombaan Senjata AI, Menyebabkan Biaya Baru bagi Operator Situs Web. "Crawler AI Telah Menyebabkan Kami Biaya Bandwidth yang Signifikan dan Memakan Banyak Waktu untuk Menangani Penyalahgunaan," Tulis Eric Holscher, Co-Founder Situs Hosting Dokumen Read the Docs, dalam Sebuah Postingan Blog.

Sure, here is the translation of the heading to Indonesian:

Anthropic telah menciptakan beberapa chatbot paling canggih di dunia yang menyaingi ChatGPT milik OpenAI, dan memposisikan dirinya sebagai pelaku yang etis. Tujuan yang dinyatakan oleh Anthropic adalah "pengembangan dan pemeliharaan AI canggih yang bertanggung jawab untuk manfaat jangka panjang umat manusia.

Selagi perusahaan AI terkemuka mengembangkan model yang semakin canggih, mereka semakin dalam merambah sudut-sudut internet yang belum tersentuh, bekerja sama dengan penerbit atau membuat data pelatihan sintetis. OpenAI telah mengadakan beberapa kesepakatan dengan penerbit dan penyedia konten seperti Reddit, The Atlantic, dan Financial Times dalam beberapa bulan terakhir. Anthropic belum mengumumkan kemitraan serupa secara publik.

„Mesin pencari selalu melakukan scraping“, kata Barrie, „tetapi dengan pelatihan AI generatif, ini telah meningkat ke level yang benar-benar baru.”

Misi iFixit adalah untuk berbagi informasi agar mendorong orang untuk melakukan perbaikan sendiri. "Kami tidak keberatan jika mereka menggunakan konten kami untuk pelatihan model, kami hanya ingin menjadi bagian dari percakapan," kata Wiens. "Saya bukan pejuang dalam hal ini, saya hanya mencoba untuk menjaga sebuah situs web tetap online.

Lakukan investasi terbaik dalam hidupmu
fair value · 20 million securities worldwide · 50 year history · 10 year estimates · leading business news

Mulai dari 2 €

Berita